離散型確率変数から連続型確率変数への移行は、観点の画期的な転換を意味します。個々の「質量点」を足し合わせるという考えから、密度関数曲線の下にある滑らかな「面積」を測定するという考え方へと変わります。離散型変数は数え切れる結果を扱うのに対し、連続型変数は時間、距離、重さといった現実世界の無限に細かい性質をモデル化します。
核心の転換:和から積分へ
確率変数 $X$ が連続型であるとは、非負の関数 $f$ が存在し、これを 確率密度関数(PDF) として、任意の実数の集合 $B$ に対して次が成り立つことを意味します:
$P\{X \in B\} = \int_B f(x) dx$
重要な点は、任意の特定値 $a$ に対して $P(X = a) = \int_a^a f(x) dx = 0$ となることです。連続型の世界では、区間上の確率についてのみ議論できます。
PDFとCDFの共生関係
累積分布関数(CDF)$F(x)$ は、$-\infty$ から $x$ までの確率の総計を表します:
関係式
$F(x) = P\{X \le x\} = \int_{-\infty}^{x} f(t) dt$
微分
微積分学の基本定理により、密度関数は確率が蓄積される割合、すなわち変化率を表します: $\frac{d}{dx}F(x) = f(x)$
代表値
- 期待値: $E[X] = \int_{-\infty}^{\infty} xf(x) dx$
- 中央値($m$): 累積分布関数が $\frac{1}{2}$ になる点、すなわち面積を二等分する点です。
- 最頻値: $f(x)$ が最大値を取る $x$ の値です。
和の限界
私たちの旅における「積分」の意義を理解するために、離散的世界と対比しましょう。ここでは、 レジェンドルの定理 ($\sum_{k=1}^{\infty} 1/k^2 = \pi^2/6$) または複雑な除数に関する論理($D=k$ のとき、$k$ が $X$ と $Y$ 両方を割り切り、かつ $X/k$ と $Y/k$ が互いに素でなければならない)といったものを探すことになります。それに対して連続的世界では、分散は $Var(X) = E[(X - E[X])^2]$ として計算され、関数の期待値は $E[g(X)] = \int_{-\infty}^{\infty} g(x)f(x) dx$ によって求められます。
🎯 主な洞察
期待値は、累積分布関数(CDF)と水平線 $y=0$ および $y=1$ との間の面積としても捉えることができます。任意の確率変数 $Y$ に対して:
$E[Y] = \int_{0}^{\infty} P\{Y > y\} dy - \int_{0}^{\infty} P\{Y < -y\} dy$